ترجمه هوشمند اسامی فارسی در بازیابی اطلاعات بین زبانی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر
- نویسنده زهره حق اللهی
- استاد راهنما علی محمد زارع بیدکی علیرضا یاری
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
با گسترش روزافزون استفاده از اینترنت، کاربران و جستجوگران اطلاعات، دیگر تنها به منابع اطلاعاتی که به زبان آنها نوشته شده اکتفا نمی کنند. بنابراین سیستم های بازیابی اطلاعات بین زبانی، این نیاز را برای کاربران برآورده می سازند. به این صورت که می توان تنها با دادن پرس وجو در یک زبان، اسناد با زبان های مختلف را بازیابی کرد. از بین پرس وجوهای کاربران، اسامی افراد از اهمیت خاصی برخوردار هستند. زیرا تعداد زیادی از پرس وجوها به اسامی افراد اختصاص می یابد. همچنین کاربران زیادی صفحات شخصی خود را به زبان های دیگر طراحی می کنند. بنابراین در صورت تشخیص این اسامی در پرس وجوها و تبدیل آنها به زبان های دیگر (که نویسه گردانی نام دارد)، می توان به صفحات شخصی آنها مستقل از زبانی که هستند، دست یافت. در این پایان نامه، مروری کوتاه بر الگوریتم های تشخیص نام، سیستم های بازیابی اطلاعات بین زبانی و نیز به طور خاص نویسه گردانی کلمات انجام شده است. همچنین چالش های مطرح شده در این زمینه و روش عملکرد و نقاط قوت و ضعف آنها مورد بررسی قرار گرفته اند. در ادامه روشی برای تشخیص اسامی افراد به زبان فارسی با استفاده از موتور جستجو و همچنین روشی نوین به منظور نویسه گردانی این اسامی با استفاده از محتوای صفحات وب فارسی پیشنهاد شده است. مطابق آزمایشات انجام شده با استفاده از روش های پیشنهادی، می توان به دقت بالایی در زمینه تشخیص و ترجمه اسامی خاص و یا به عبارتی بازیابی اطلاعات بین زبانی اسامی افراد دست پیدا کرد.
منابع مشابه
بررسی کارآمدی روش های موجود در بازیابی اطلاعات بین زبانی فارسی- انگلیسی با استفاده از واژه نامه دوزبانه ماشین خوان
در این پژوهش میزان تأثیر انجام پردازش های زبان طبیعی بر روی ترجمه عبارت های جستجو با آزمون فرضیه های پژوهش مشخص گردید. فنون پردازش زبان طبیعی که برای پردازش عبارت های جستجو به کار گرفته شد شامل قطعه بندی متن، شناخت گونه های زبانشناختی، حذف سیاهه بازدارنده، تحلیل مورفولوژیک، و برچسب زنی انواع نقش دستوری بود. آزمون فرضیه اول نشان داد که استفاده از روش ترجمه اولین برابرنهاده در مقایسه با شیوه انتخ...
متن کاملبررسی تأثیرات ریشهیابی در بازیابی اطلاعات در زبان فارسی
Using the language-specific behavior in information retrieval systems can improve the quality of the retrieved results significantly. Part of the word that remains after removing its affixes is called stem. Stemming process can be used for improving the relevancy of the results in information retrieval system. Different morphological variants of words (plural, past tense…) will be mapped into t...
متن کاملسنجش میزان تکرار اطلاعات در بازیابی اطلاعات فارسی از وب با مقایسۀ موتورهای کاوش عمومی
هدف: پژوهش حاضر با هدف سنجش میزان تکرار اطلاعات بازیابیشدۀ فارسی در وب و مقایسۀ موتورهای کاوش از لحاظ میزان توانمندی در بازیابی کمترین تکرار در محتوای نتایج انجام گرفت. روش: این پژوهش، از دستۀ مطالعات توصیفی است که از روشهای کمّی و آمار توصیفی بهره میگیرد و با توجه به مقایسه و ارزیابی موتورهای کاوش، در زمرۀ تحقیقات ارزیابی نظامهای بازیابی اطلاعات نیز محسوب میشود. یافتهها: یافتهها...
متن کاملتحلیلی بین زبانی از پارامتر ضمیراندازی در زبان فارسی
پارامتر ضمیر اندازی را میتوان همان "محدودیت نیاز به فاعل" در نظر گرفت که در اولین مطالعات زایشی در این زمینه توسط پرمیوتر (1971) مطرح شد (جگلی و سفیر 1991) . براساس این پارامتر زبانهای فاعل تهی (null subject) یا ضمیر انداز (pro-drop) در جملات زماندار میتوانند دارای فاعلهای ناملفوظ باشند و در مقابل زبانهای غیر ضمیرانداز الزاماً ضمیر فاعلی با نمود آوایی دارند. به موجب این پارامتر، زبانهای د...
متن کاملرتبه بندی کیفی موتورهای کاوش فارسی و غیر فارسی در بازیابی اطلاعات حوزه اسلام
هدف: هدف پژوهش حاضر تعیین رتبۀ کیفیِ محتوای صفحات وب بازیابیشده از موتورهای کاوش فارسی و غیرفارسی در حوزه اسلام است. روششناسی: این پژوهش از نظر هدف کاربردی است و به روش پیمایشی _ توصیفی انجام شده است. ابزار گردآوری دادهها، سیاهۀ ارزیابی محققساخته با چهار معیار و متشکل از گویههای عمومی و تخصصی است. روایی ابزار با نظر ...
متن کاملتحلیل مقولههای نسبیت زبانی در عربی نسبت به فارسی و تأثیر آن بر ترجمه
در رابطة زبان و تفکر، هنوز هم سخن از فرضیة نسبیت زبانی میتواند بحثبرانگیز باشد. این فرضیه که بیشتر به نام ادوارد ساپیر و لی وورف شناخته میشود، بر کیفیت تأثیر زبان بر تفکر استوار است. در نوع افراطی آن، این «زبان» است که تعیینکننده و جهتدهندة اندیشه است و در نوع خفیف آن، زبان در بخشهایی از تفکر اثر میگذارد. مبنای فرضیه این است که گویشوران هر زبان از دریچة زبان خود با جهان مواجه میشوند و آ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023